package farmers.html;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

import java.io.IOException;

/**
 * 教程网址
 * https://blog.csdn.net/weixin_29882269/article/details/112078260
 */
public class JsoupDemo {
    public static void main(String[] args) throws IOException {
//        Document document = Jsoup.connect("http://www.baidu.com").get();
//        System.out.println(document.title());
//
//
//        Document document2 = Jsoup.parse("<style>p {font-size:10px}</style>");
//        System.out.println(document2);


//        File file = new File("./index.html");
//        System.out.println(file.getAbsolutePath());
//        Document document = Jsoup.parse(file, "UTF-8");
//        System.out.println(document);


        // 输出所有A标签
//        File file = new File("./index.html");
//        Document document = Jsoup.parse(file, "UTF-8");
//        Elements elements = document.getElementsByTag("a");
//        for (Element element : elements) {
//            System.out.println(element);
//        }


//        可以用下列方法提取元素的数据：
//
//        attr(String key)获取元素key属性的值
//        attributes()获取元素所有属性
//        id()获取元素id属性的值
//        className和classNames获取元素class属性的值
//        text()获取元素内容

        // DOM方法
//        File file = new File("./index.html");
//        Document document = Jsoup.parse(file, "UTF-8");
//        Elements elements = document.getElementsByTag("a");
//        for (Element element : elements) {
//            System.out.println(element.text() + " : " + element.attr("href"));
//        }


        // 选择器方法
//        File file = new File("./index.html");
//        Document document = Jsoup.parse(file, "UTF-8");
        Document document = Jsoup.connect("http://www.baidu.com").get();
        Elements elements = document.select("a[href]");
        for (Element element : elements) {
//            System.out.println(element);
            System.out.println(element.text() + " : " + element.attr("href"));
        }

    }
}